Алгоритмическая структура
Численные решения строят последовательность минимизации: последовательность точек $x^{(0)}, x^{(1)}, \dots \in \text{dom } f$ с $f(x^{(k)}) \to p^*$ при $k \to \infty$. Каждый шаг обновляет положение по формуле $x^{(k+1)} = x^{(k)} + t^{(k)}\Delta x^{(k)}$, где $\Delta x$ — направление спуска.
Методы, описанные в этой главе, требуют подходящей начальной точки $x^{(0)}$. Начальная точка должна лежать в $\text{dom } f$, а кроме того, подуровневое множество $S = \{x \in \text{dom } f \mid f(x) \le f(x^{(0)})\}$ должно быть замкнутым. Это гарантирует, что последовательность остается в хорошо поведающейся области, где гессиан предоставляет полезную информацию.
Простейшим направлением является $\Delta x = -\nabla f(x)$. Однако эффективность часто требует учета различных геометрий через направление наискорейшего спуска:
- Квадратичная норма: $\|z\|_P = (z^T P z)^{1/2} = \|P^{1/2}z\|_2$.
- $L_\infty$ норма: $\Delta x_{\text{sd}} = \Delta x_{\text{nsd}} \|\nabla f(x)\|_\infty = - \frac{\partial f(x)}{\partial x_i} e_i$ (Метод координатного спуска).
Модели второго порядка и доверительные области
Метод Ньютона использует аппроксимацию Тейлора второго порядка: $$\hat{f}(x+v) = f(x) + \nabla f(x)^T v + \frac{1}{2} v^T \nabla^2 f(x) v$$ Эта квадратичная функция минимизируется при $v = \Delta x_{nt}$ (шаг Ньютона). Мы определяем доверительную область: множество $\{v \mid \|v\|_2 \le \gamma\}$. Параметр $\gamma$ отражает нашу уверенность в модели второго порядка. Когда модель точна, мы решаем направление по формуле $v = L^{-T}w = -L^{-T}L^{-1}P^T g$ в системах ККТ.
- Оценка недостаточности: $p^* \geq f(x) + \lambda(x) + \log(1 - \lambda(x))$, верно при $\lambda(x) < 1$.
- Сумма самосогласованности: Если $f_1, f_2$ самосогласованы, то $f_1 + f_2$ также самосогласована.
- Разреженность гессиана: Эффективность достигается, если условие разреженности гессиана: $\nabla^2 f(x)_{ij} = 0$ при $|i-j| > k$ выполняется.